<!doctype html>



  


<html class="theme-next mist use-motion" lang="zh-Hans">
<head>
  <meta charset="UTF-8"/>
<meta http-equiv="X-UA-Compatible" content="IE=edge" />
<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=1"/>



<meta http-equiv="Cache-Control" content="no-transform" />
<meta http-equiv="Cache-Control" content="no-siteapp" />















  
  
  <link href="/lib/fancybox/source/jquery.fancybox.css?v=2.1.5" rel="stylesheet" type="text/css" />




  
  
  
  

  
    
    
  

  

  

  

  

  
    
    
    <link href="//fonts.googleapis.com/css?family=Lato:300,300italic,400,400italic,700,700italic&subset=latin,latin-ext" rel="stylesheet" type="text/css">
  






<link href="/lib/font-awesome/css/font-awesome.min.css?v=4.6.2" rel="stylesheet" type="text/css" />

<link href="/css/main.css?v=5.1.0" rel="stylesheet" type="text/css" />


  <meta name="keywords" content="数据,价值,评估," />








  <link rel="shortcut icon" type="image/x-icon" href="/favicon.ico?v=5.1.0" />






<meta name="description" content="近几年来，在广告领域里大数据及用户画像技术已经变成“常规武器”，关于大数据价值的思考也开始向实用化方向延伸。如果你做的技术恰好有合适的业务指标进行评价，那么恭喜你，你自然的有了评价自己工作效果的手段，如果你恰好在“专注”的做数据供给各个业务部门或其它第三方公司使用那很“不幸”，你面临最大的问题和困惑就是：如何证明你的产出是优秀的对业务有提升的？因为仅仅证明你做的是对的是不足以打动数据使用者的。">
<meta name="keywords" content="数据,价值,评估">
<meta property="og:type" content="article">
<meta property="og:title" content="数据价值评估的思考">
<meta property="og:url" content="https://suwenkui.github.io/2016/06/01/data-value/index.html">
<meta property="og:site_name" content="Kevin Su&#39;s Blog">
<meta property="og:description" content="近几年来，在广告领域里大数据及用户画像技术已经变成“常规武器”，关于大数据价值的思考也开始向实用化方向延伸。如果你做的技术恰好有合适的业务指标进行评价，那么恭喜你，你自然的有了评价自己工作效果的手段，如果你恰好在“专注”的做数据供给各个业务部门或其它第三方公司使用那很“不幸”，你面临最大的问题和困惑就是：如何证明你的产出是优秀的对业务有提升的？因为仅仅证明你做的是对的是不足以打动数据使用者的。">
<meta property="og:image" content="https://suwenkui.github.io/img/jiagou.png">
<meta property="og:image" content="https://suwenkui.github.io/img/pingu.png">
<meta property="og:updated_time" content="2017-06-06T04:33:19.000Z">
<meta name="twitter:card" content="summary">
<meta name="twitter:title" content="数据价值评估的思考">
<meta name="twitter:description" content="近几年来，在广告领域里大数据及用户画像技术已经变成“常规武器”，关于大数据价值的思考也开始向实用化方向延伸。如果你做的技术恰好有合适的业务指标进行评价，那么恭喜你，你自然的有了评价自己工作效果的手段，如果你恰好在“专注”的做数据供给各个业务部门或其它第三方公司使用那很“不幸”，你面临最大的问题和困惑就是：如何证明你的产出是优秀的对业务有提升的？因为仅仅证明你做的是对的是不足以打动数据使用者的。">
<meta name="twitter:image" content="https://suwenkui.github.io/img/jiagou.png">



<script type="text/javascript" id="hexo.configurations">
  var NexT = window.NexT || {};
  var CONFIG = {
    root: '/',
    scheme: 'Mist',
    sidebar: {"position":"left","display":"post","offset":12,"offset_float":0,"b2t":false,"scrollpercent":false},
    fancybox: true,
    motion: true,
    duoshuo: {
      userId: '0',
      author: '博主'
    },
    algolia: {
      applicationID: '',
      apiKey: '',
      indexName: '',
      hits: {"per_page":10},
      labels: {"input_placeholder":"Search for Posts","hits_empty":"We didn't find any results for the search: ${query}","hits_stats":"${hits} results found in ${time} ms"}
    }
  };
</script>



  <link rel="canonical" href="https://suwenkui.github.io/2016/06/01/data-value/"/>





  <title> 数据价值评估的思考 | Kevin Su's Blog </title>
</head>

<body itemscope itemtype="http://schema.org/WebPage" lang="zh-Hans">

  





  <script type="text/javascript">
    var _hmt = _hmt || [];
    (function() {
      var hm = document.createElement("script");
      hm.src = "https://hm.baidu.com/hm.js?7512fa4fb29b9a88731187e08afb0f5a";
      var s = document.getElementsByTagName("script")[0];
      s.parentNode.insertBefore(hm, s);
    })();
  </script>










  
  
    
  

  <div class="container sidebar-position-left page-post-detail ">
    <div class="headband"></div>

    <header id="header" class="header" itemscope itemtype="http://schema.org/WPHeader">
      <div class="header-inner"><div class="site-brand-wrapper">
  <div class="site-meta ">
    

    <div class="custom-logo-site-title">
      <a href="/"  class="brand" rel="start">
        <span class="logo-line-before"><i></i></span>
        <span class="site-title">Kevin Su's Blog</span>
        <span class="logo-line-after"><i></i></span>
      </a>
    </div>
      
        <p class="site-subtitle"></p>
      
  </div>

  <div class="site-nav-toggle">
    <button>
      <span class="btn-bar"></span>
      <span class="btn-bar"></span>
      <span class="btn-bar"></span>
    </button>
  </div>
</div>

<nav class="site-nav">
  

  
    <ul id="menu" class="menu">
      
        
        <li class="menu-item menu-item-home">
          <a href="/" rel="section">
            
              <i class="menu-item-icon fa fa-fw fa-home"></i> <br />
            
            首页
          </a>
        </li>
      
        
        <li class="menu-item menu-item-archives">
          <a href="/archives" rel="section">
            
              <i class="menu-item-icon fa fa-fw fa-archive"></i> <br />
            
            归档
          </a>
        </li>
      

      
    </ul>
  

  
</nav>



 </div>
    </header>

    <main id="main" class="main">
      <div class="main-inner">
        <div class="content-wrap">
          <div id="content" class="content">
            

  <div id="posts" class="posts-expand">
    

  

  
  
  

  <article class="post post-type-normal " itemscope itemtype="http://schema.org/Article">
    <link itemprop="mainEntityOfPage" href="https://suwenkui.github.io/2016/06/01/data-value/">

    <span hidden itemprop="author" itemscope itemtype="http://schema.org/Person">
      <meta itemprop="name" content="Kevin Su">
      <meta itemprop="description" content="">
      <meta itemprop="image" content="/images/avatar.gif">
    </span>

    <span hidden itemprop="publisher" itemscope itemtype="http://schema.org/Organization">
      <meta itemprop="name" content="Kevin Su's Blog">
    </span>

    
      <header class="post-header">

        
        
          <h1 class="post-title" itemprop="name headline">
            
            
              
                数据价值评估的思考
              
            
          </h1>
        

        <div class="post-meta">
          <span class="post-time">
            
              <span class="post-meta-item-icon">
                <i class="fa fa-calendar-o"></i>
              </span>
              
                <span class="post-meta-item-text">发表于</span>
              
              <time title="创建于" itemprop="dateCreated datePublished" datetime="2016-06-01T10:21:31+08:00">
                2016-06-01
              </time>
            

            

            
          </span>

          
            <span class="post-category" >
            
              <span class="post-meta-divider">|</span>
            
              <span class="post-meta-item-icon">
                <i class="fa fa-folder-o"></i>
              </span>
              
                <span class="post-meta-item-text">分类于</span>
              
              
                <span itemprop="about" itemscope itemtype="http://schema.org/Thing">
                  <a href="/categories/技术文章/" itemprop="url" rel="index">
                    <span itemprop="name">技术文章</span>
                  </a>
                </span>

                
                
              
            </span>
          

          
            
          

          
          

          

          

          

        </div>
      </header>
    


    <div class="post-body" itemprop="articleBody">

      
      

      
        <p>  近几年来，在广告领域里大数据及用户画像技术已经变成“常规武器”，关于大数据价值的思考也开始向实用化方向延伸。如果你做的技术恰好有合适的业务指标进行评价，那么恭喜你，你自然的有了评价自己工作效果的手段，如果你恰好在“专注”的做数据供给各个业务部门或其它第三方公司使用那很“不幸”，你面临最大的问题和困惑就是：如何证明你的产出是优秀的对业务有提升的？因为仅仅证明你做的是对的是不足以打动数据使用者的。<br>  <a id="more"></a></p>
<h2 id="“做对”就是件不容易的事情"><a href="#“做对”就是件不容易的事情" class="headerlink" title="“做对”就是件不容易的事情"></a>“做对”就是件不容易的事情</h2><p>  很多人觉得目前大数据平台技术和机器学习开源包使得做对是件很容易完成的事情，无非就是工程化的过程而已，其实事情往往不那么简单。<br>从上述的数据管理平台的基本架构可以看出，从数据收集-&gt;数据处理-&gt;数据服务是一个流程比较长的过程，期间还伴生着很多要这个流程正常运作的基础类目及运营监控，每个地方略有疏忽都会影响到数据的对外服务。而往往很多时候这些东西因为没有产出而被“忽略”，因为大家可以很“正确”的说，如果没有好的产出，这些东西都是没有价值的，很“神奇”的是对于这种观点即便觉得有那么点儿不对可是总体上说的好像也没有错。其实做数据是件很“严谨(苦逼)”的事情，上述的每个地方做的不好怎么可能有好的产出呢？<br><img src="/img/jiagou.png" alt="数据管理平台基本架构">  </p>
<h2 id="“做好”是件更不容易的事情"><a href="#“做好”是件更不容易的事情" class="headerlink" title="“做好”是件更不容易的事情"></a>“做好”是件更不容易的事情</h2><p>  如何评价一个数据管理平台的产出是好还是坏本身就是个难题，往往现在的数据平台在对外交流的时候说的都是自己的数据源如何如何的覆盖高数据准，很少会提自己的技术多好多先进，为什么呢？因为前者比较好理解，后者很难说清楚。也有些会说自己做的对，但是不保证“好用”，因为各自的业务的差异。<br>可是如果你是个弱势的第三方或者公司里边的一个部门，如果不说清你做得“好”，如何评价你的价值呢？所以还是要建立一些指标来对产出进行评价。<br>经过多年的探索，业界渐渐形成一套不太完善的评估体系，该体系大体可以分成两个部分：离线评估与在线评估。每个阶段有些自己的指标：</p>
<h3 id="离线评估"><a href="#离线评估" class="headerlink" title="离线评估"></a>离线评估</h3><p>  步骤1：用户重合度<br>  步骤2：标签的准确率（有监督和基于规则）<br>  半手工的方式进行，基于监督数据或规则与用户行为分析判断标签的准确性。<br>(结合规则的使用率和日志覆盖度及人群标签的分布)<br>  步骤3：标签的覆盖度<br>  统计标签及各个子类的人群覆盖度，流量覆盖度。</p>
<h3 id="在线评估"><a href="#在线评估" class="headerlink" title="在线评估"></a>在线评估</h3><p><img src="/img/pingu.png" alt="在线评估">  </p>
<p>  根据对线上指标的影响分析，对数据进行评估。<br>  其实离线评估或许还相对客观可衡量，在线评估就相对比较难。因为从数据多业务指标可能还隔着很远的“路程”，影响的因素也千变万化，但从概率上来分析这种评估方式还是可以被各方接受的。</p>
<h2 id="总结"><a href="#总结" class="headerlink" title="总结"></a>总结</h2><p>  做数据价值的评估是件难做的事情，可是也不是无规律可循的，认认真真把每一个步骤做好才能得到期待的结果（虽然这个事情很难）。做任何事情的第一个步骤就应该是制定评价标准，这样做事情才能确定方向。“神化”和“工程化”数据平台技术都是片面的，大数据正在照进现实，扎扎实实的做好每个步骤，确确实实的支撑业务才是正道。</p>

      
    </div>

    <div>
      
        

      
    </div>

    <div>
      
        

      
    </div>

    <div>
      
        

      
    </div>

    <footer class="post-footer">
      
        <div class="post-tags">
          
            <a href="/tags/数据/" rel="tag"># 数据</a>
          
            <a href="/tags/价值/" rel="tag"># 价值</a>
          
            <a href="/tags/评估/" rel="tag"># 评估</a>
          
        </div>
      

      
        
      

      
        <div class="post-nav">
          <div class="post-nav-next post-nav-item">
            
          </div>

          <span class="post-nav-divider"></span>

          <div class="post-nav-prev post-nav-item">
            
              <a href="/2017/06/06/operator-data-value/" rel="prev" title="运营商数据价值挖掘">
                运营商数据价值挖掘 <i class="fa fa-chevron-right"></i>
              </a>
            
          </div>
        </div>
      

      
      
    </footer>
  </article>



    <div class="post-spread">
      
    </div>
  </div>


          </div>
          


          
  <div class="comments" id="comments">
    
  </div>


        </div>
        
          
  
  <div class="sidebar-toggle">
    <div class="sidebar-toggle-line-wrap">
      <span class="sidebar-toggle-line sidebar-toggle-line-first"></span>
      <span class="sidebar-toggle-line sidebar-toggle-line-middle"></span>
      <span class="sidebar-toggle-line sidebar-toggle-line-last"></span>
    </div>
  </div>

  <aside id="sidebar" class="sidebar">
    <div class="sidebar-inner">

      

      
        <ul class="sidebar-nav motion-element">
          <li class="sidebar-nav-toc sidebar-nav-active" data-target="post-toc-wrap" >
            文章目录
          </li>
          <li class="sidebar-nav-overview" data-target="site-overview">
            站点概览
          </li>
        </ul>
      

      <section class="site-overview sidebar-panel">
        <div class="site-author motion-element" itemprop="author" itemscope itemtype="http://schema.org/Person">
          <img class="site-author-image" itemprop="image"
               src="/images/avatar.gif"
               alt="Kevin Su" />
          <p class="site-author-name" itemprop="name">Kevin Su</p>
           
              <p class="site-description motion-element" itemprop="description">Black Eyes looking for something in Big Data.</p>
          
        </div>
        <nav class="site-state motion-element">

          
            <div class="site-state-item site-state-posts">
              <a href="/archives">
                <span class="site-state-item-count">3</span>
                <span class="site-state-item-name">日志</span>
              </a>
            </div>
          

          
            
            
            <div class="site-state-item site-state-categories">
              
                <span class="site-state-item-count">1</span>
                <span class="site-state-item-name">分类</span>
              
            </div>
          

          
            
            
            <div class="site-state-item site-state-tags">
              
                <span class="site-state-item-count">7</span>
                <span class="site-state-item-name">标签</span>
              
            </div>
          

        </nav>

        

        <div class="links-of-author motion-element">
          
        </div>

        
        

        
        

        


      </section>

      
      <!--noindex-->
        <section class="post-toc-wrap motion-element sidebar-panel sidebar-panel-active">
          <div class="post-toc">

            
              
            

            
              <div class="post-toc-content"><ol class="nav"><li class="nav-item nav-level-2"><a class="nav-link" href="#“做对”就是件不容易的事情"><span class="nav-number">1.</span> <span class="nav-text">“做对”就是件不容易的事情</span></a></li><li class="nav-item nav-level-2"><a class="nav-link" href="#“做好”是件更不容易的事情"><span class="nav-number">2.</span> <span class="nav-text">“做好”是件更不容易的事情</span></a><ol class="nav-child"><li class="nav-item nav-level-3"><a class="nav-link" href="#离线评估"><span class="nav-number">2.1.</span> <span class="nav-text">离线评估</span></a></li><li class="nav-item nav-level-3"><a class="nav-link" href="#在线评估"><span class="nav-number">2.2.</span> <span class="nav-text">在线评估</span></a></li></ol></li><li class="nav-item nav-level-2"><a class="nav-link" href="#总结"><span class="nav-number">3.</span> <span class="nav-text">总结</span></a></li></ol></div>
            

          </div>
        </section>
      <!--/noindex-->
      

      

    </div>
  </aside>


        
      </div>
    </main>

    <footer id="footer" class="footer">
      <div class="footer-inner">
        <div class="copyright" >
  
  &copy; 
  <span itemprop="copyrightYear">2017</span>
  <span class="with-love">
    <i class="fa fa-heart"></i>
  </span>
  <span class="author" itemprop="copyrightHolder">Kevin Su</span>
</div>


<div class="powered-by">
  由 <a class="theme-link" href="https://hexo.io">Hexo</a> 强力驱动
</div>

<div class="theme-info">
  主题 -
  <a class="theme-link" href="https://github.com/iissnan/hexo-theme-next">
    NexT.Mist
  </a>
</div>


        

        
      </div>
    </footer>

    
      <div class="back-to-top">
        <i class="fa fa-arrow-up"></i>
        
      </div>
    

  </div>

  

<script type="text/javascript">
  if (Object.prototype.toString.call(window.Promise) !== '[object Function]') {
    window.Promise = null;
  }
</script>









  






  
  <script type="text/javascript" src="/lib/jquery/index.js?v=2.1.3"></script>

  
  <script type="text/javascript" src="/lib/fastclick/lib/fastclick.min.js?v=1.0.6"></script>

  
  <script type="text/javascript" src="/lib/jquery_lazyload/jquery.lazyload.js?v=1.9.7"></script>

  
  <script type="text/javascript" src="/lib/velocity/velocity.min.js?v=1.2.1"></script>

  
  <script type="text/javascript" src="/lib/velocity/velocity.ui.min.js?v=1.2.1"></script>

  
  <script type="text/javascript" src="/lib/fancybox/source/jquery.fancybox.pack.js?v=2.1.5"></script>


  


  <script type="text/javascript" src="/js/src/utils.js?v=5.1.0"></script>

  <script type="text/javascript" src="/js/src/motion.js?v=5.1.0"></script>



  
  

  
  <script type="text/javascript" src="/js/src/scrollspy.js?v=5.1.0"></script>
<script type="text/javascript" src="/js/src/post-details.js?v=5.1.0"></script>



  


  <script type="text/javascript" src="/js/src/bootstrap.js?v=5.1.0"></script>



  


  




	





  





  





  






  





  

  

  

  

</body>
</html>
